Séparation recto/verso d’un document par modélisation markovienne à double couche
نویسندگان
چکیده
Nous proposons un modèle markovien à deux couches pour la séparation des deux faces d’un document, dont une seule face a été numérisé. A l’aide de deux champs de Markov séparés, un pour chaque face, chaque pixel est modélisé par deux variables cachées connectées par une unique variable observée. L’avantage de cette formulation est une meilleure adaptation au processus ayant créé l’image observée (la superposition de deux pages indépendantes) ainsi que l’amélioration de la restauration, ç.à.d. de l’estimation des pixels recto, par une estimation des pixels verso couverts par ce derniers. L’inférence des variables cachées est réalisée par un algorithme itératif à base de coupure minimale dans un graphe étendant l’algorithme d’éxpansion alpha. Les résultats sont évalués à la fois de façon empirique ainsi que par l’amélioration d’un résultat de reconnaissance OCR.
منابع مشابه
Reflectance and transmittance model for recto-verso halftone prints.
We propose a spectral prediction model for predicting the reflectance and transmittance of recto-verso halftone prints. A recto-verso halftone print is modeled as a diffusing substrate surrounded by two inked interfaces in contact with air (or with another medium). The interaction of light with the print comprises three components: (a) the attenuation of the incident light penetrating the print...
متن کاملRestoration of recto-verso colour documents using correlated component analysis
In this article, we consider the problem of removing see-through interferences from pairs of recto–verso documents acquired either in grayscale or RGB modality. The see-through effect is a typical degradation of historical and archival documents or manuscripts, and is caused by transparency or seeping of ink from the reverse side of the page. We formulate the problem as one of separating two in...
متن کاملAn iterative graph cut optimization algorithm for a double MRF prior
In a previous publication we presented a double MRF model capable of separatly regularizing the recto and verso side of a document suffering from ink bleed through. In this paper we show that this model naturally leads to an efficient optimization method based on the minimum cut/maximum flow in a graph. The proposed method is evaluated on scanned document images from the 18 century, showing an ...
متن کاملSur les collapses de corps différentiels colorés en caractéristique nulle décrits par Poizat à l'aide des amalgames à la Hrushovski
En 1991, Hrushovski [7, 5] donna une preuve de la conjecture de Mordell-Lang pour les corps de fonctions. Ce résultat était déjà connu en caractéristique nulle, mais l’originalité de cette nouvelle preuve réside dans son approche uniforme en toutes caractéristiques. Elle consiste à remplacer la structure du corps algébriquement clos de base, par une structure de corps dans laquelle l’énoncé de ...
متن کامل